电话语音识别和合成系统具有广泛的应用前景,任何VRU(VoiceRespondingUnit)应用都可以同语音识别和合成功能相结合,为用户提供人性化的交互界面。在不久的将来,金融、因特网信息查询、电话通信、旅游交通、娱乐休闲等领域将成为这一技术的应用热点。
IBM提供的电话语音识别和合成系统汉语ViaVoiceTelephonyRuntime&Tools1.2(普通话版和粤语版)具有如下一些特点:
说话人无关任何能讲汉语普通话或粤语的人都可以使用。
高识别率内部的语音识别引擎是使用真实的电话信道语音数据训练得到的,在正常的电话信道环境中具有很高的识别率。
无限词汇量可以很好地辩识开发人员定义的任何词表。
连续发音使用者不需要在词汇间有任何停顿,可以同系统连续交谈。
多候选集的输出输出不同候选结果的相似度得分。
支持语音合成高自然度、高清晰度、高可懂度的文语转换系统(普通话版和粤语版)是汉语ViaVoiceTelephony技术的另一个重要构件。
信道自适应系统可以自动适应不同信噪比的电话信道。
与硬件无关的标准C/C++接口让用户可以方便地挂接语音识别和语音合成引擎。
出色的可伸缩性从小型办公室到企业级电话语音系统解决方案,并提供全自动的动态负载平衡。
强大的技术支持服务IBM中国研究中心已经在语音识别的电话应用领域积累了多年的经验和技术。
VoicePortal技术的特点在于它将IVR(InteractiveVoiceResponding)服务器和WEB服务器紧密地结合了起来,将复杂的CALLFLOW程序的编写转化为了XML页面的描述,从而,使得非计算机专业的人士可以方便快捷地开发自己的语音门户网站。目前英文版已经推出。